伺服器世界
-
老黃x蘇媽 合力打造世界最強DGX A100超級電腦,牙膏廠掰掰! ft. GTC 2020重點介紹
NVIDIA正式於台北時間5月15日舉辦的GTC 2020 (GPU技術大會2020),CEO黃仁勳在自宅的廚房進行線上演說,主要也順便呼籲當今疫情嚴峻,待在家裡最好!也順便向抗疫英雄們致上最高敬意! 在這場GPU技術盛宴中,老黃端出自家最新,並展示其元件構成,包含世界最強大基於台積電7nm製程、Ampere架構的A100 GPU,並提及其伺服器運用到AMD的Rome CPU (即第二代EPYC伺服器處理器),兩強聯手打造出真正「地表最強」的資料中心級伺服器,就連蘇媽也在Twitter恭賀NVIDIA發表的最新產品,有用到她們家的CPU!牙膏廠可說是在HPC市場中,真正被放鳥! NVIDIA的GPU技術大會,主要區分為5大部份,包含從數據中心級的運算,到可協作的RTX伺服器遠距利用,當然還有今天的主角:A100 GPU與DGX A100伺服器,以及運用該伺服器所做到的三層AI運用,最後則是EGX智慧物連網的邊緣AI運算以及ISSAC智慧機器人等應用。 在這次的主力產品中,主要有上述採用TSMC 7nm製程生產的A100 GPU,為最新Ampere GPU架構,但是並沒有公佈消費級的RTX 3000系列,因此這場GTC 2020大會中,幾乎都是B2B的產品為主,市場也以專業繪圖、醫學、生技、工程、科學、數學、AI(人工智慧)、零售、工廠、車用、智慧物聯…等領域為主。以下藉由簡報內容,來快速了解這次NVIDIA到底「端出」什麼菜。 NVIDIA CEO黃仁勳首先向COVID-19抗疫英雄們致敬,並簡介其加入全球醫療合作夥伴的,詳細新聞可以。 由於數據中心都是平行運算,除了CPU和GPU要夠快,其之間的通訊也要夠快才行,因此要搭配超強的智慧網卡與智慧交換器,才能將運算好的資料結果與其他處理器溝通,以完成各種密集運算。 因此,NVIDIA先前併購Mellanox的用意,就是建構處理器之間的高速公路,也就是網路系統。Mellanox推出的高速智慧交換器與無線網卡,剛好可以滿足NVIDIA數據中心級伺服器在高速資料互連的需求。有關於這次發表的高速網卡產品,可以。 由於當今繪圖工作站,需要更即時、更強大的加速運算伺服器,且還要能達到協作需求,因此NVIDIA推出了Omniverse全方位RTX Server,就是針對各種專業繪圖領域的企業所量身打造,賦予專業人士們來建造未曾存在於世界上的擬真場景。 以下來看RTX伺服器在各領域的應用。 #影片=https://www.youtube.com/watch?v=H0_NZDSqR3Y Marbles RTX的示範畫面,即時光追與DLSS的極致運用 當今數據中心要將既有的大數據資料,透過ETL (擷取、轉換、載入)程序,然後再餵給伺服器去做Training (訓練),最後才達到Inference (推論)步驟,將AI推導的結果呈現出來,要經過上述三步驟才行。後兩個步驟現在幾乎都是靠GPU來處理與實現,而NVIDIA也有對應的cuDNN和TensorRT解決方案,但在第一步驟則還是要倚靠CPU來處理,因此CPU也必須夠強大才行。 不過現在這個情況即將改觀,NVIDIA也透過其RAPIDS資料分析平台,來幫Apache Spark 3.0進行GPU加速運算,也就是以往透過CPU來處理資料庫的作法,現在也能透過GPU來加速運算。因此NVIDIA的三層AI框架,幾乎可以透過GPU來加速。 這次,NVIDIA GPU支援開源社群,加快Spark 3.0的運算速度,讓ETL與SQL的處理,能以飛快的速度,處理數百TB的海量資料,讓Adobe在Databricks上使用Spark 3.0訓練模型時,速度可以提高7倍!詳細內容可以。 上面講的是第一層的大數據資料處理階段,接下來講第二層的訓練階段。這部份NVIDIA有推出其Merlin框架,是一款深度推薦應用框架,可協助零售業來分析消費者行為,並將其喜好餵給AI,以得到最確切的選購推薦。這部份當然也可以透過GPU來加速運算,透過ETL+Training都用GPU來算的話,速度比以前用CPU時還快到不可思議! 第三層就是「推論」,NVIDIA也推出其新的Jarvis應用程式框架,詳細內容可。 就是可以幫助零售業者來加速訓練。以往使用CPU來做訓練時,ETL階段就要2小時,訓練完要花1天半,若改用GPU的話,ETL階段只要3分鐘,而訓練也只要16分鐘,這真是快到不可思議的速度! 以GPU加速的NVIDIA Jarvis應用程式框架,讓企業能夠透過影片與語音資料來為各自產業、產品和客戶打造客製化的先進對話式人工智慧(AI)服務,屆時就能打造屬於企業專屬的智慧對話機器人(類似Siri),甚至可以圖像化,讓對話更加擬人化。 正因為上述NVIDIA AI三個框架,都已全面運用到GPU來加速運算,在當今資料量越來越龐大的應用下,數據中心對於HPC的效能要求也希望能呈對比級數的增長,以減少伺服器的部署,同時降低TCO成本。 為此,NVIDIA鄭重發表這次的主角,也就是A100 GPU,這款全新的數據中心級GPU,採用TSMC 7nm製程設計,Ampere架構,具備540億電晶體,內建HBM2記憶體,提供高達1.6 TB/s頻寬。並具有新的TF32 Tensor Core指令架構,比FP32快上加快!詳細規格可以。 跟上一代Volta架構的V100相比,Ampere架構的A100 GPU,在BERT Training的效能快上6倍,在BERT Inference更快7倍。其搭配尖峰效能,在各式加速運算的效能,最高可以快上20倍! 此外,老黃更從烤箱裡「端出」以A100 GPU所打造的DGX A100伺服器,詳細規格可以。 此外,NVIDIA也打造700 Petaflops的次世代 DGX SuperPOD,幫助客戶在AI工作流程中運用經驗證的企業級軟體。這些SuperPOD都是配備DGX A100伺服器,以充分發揮伺服器房的坪效。 最後,在嵌入式與邊緣AI平台方面,NVIDIA也推出EGX A100與EGX Jetson Xavier NX平台,以幫助智慧物聯、雲端AI、5G通信、車聯網、機器人等產業,建構一個雲端AI運算平台,賦予製造、零售、電信、醫療保健等產業即時的人工智慧應用。關於EGX的產品細節,可。 至於EGX Jetson Xavier NX開發套件,細節可以。 至於在車載應用方面,NVIDIA也展示搭配新的Ampere架構GPU,將讓自駕車的等級從第2級直接跳級升到第5級,也就是無人駕駛載客等級! 以上就是GTC 2020的主題演講重點內容介紹,想了解更多GTC 2020主體演講細節,可移駕到。
-
專業繪圖卡C/P值爭霸戰:AMD正式推出Radeon Pro VII,主打6埠輸出,比Quadro便宜、加總效能也強!
自AMD於2019年CES首度推出7nm的Radeon VII之後,由於該顯示卡的規格強悍,可應用於專業繪圖工作站領域,同時也能兼顧消費性遊戲領域,也就是Radeon VII身兼繪圖卡與遊戲卡的功能,讓專業人士與效能狂熱玩家來選購。 雖說Radeon VII規格強悍,採用7nm製程,但還是PCIe 3.0的架構,加上配置了16GB HBM2 (高頻寬記憶體)的設計,讓該卡不僅在遊戲應用下能擁有絕佳的效能提升,且應用在專業繪圖領域方面,也有不錯的發揮,當時定價為699美元。當時我們也有,可適合玩家與創作者選擇。 然而NVIDIA早就推出GeForce RTX 2080高階遊戲顯示卡,在整體遊戲效能的發揮上更勝一籌,雖說同樣落在699美元價位,但其具備光追特效,因此還是在遊戲市場比較吃香!此外,在專業繪圖領域,NVIDIA也有Quadro產品線,搭配其CUDA架構,可發揮出絕佳的應用。只是其價位真是高不可攀就是了! 為提供更低廉的選擇,AMD在Radeon VII發表的一年之後,也就是5月13日正式推出其衍生出來的新款專業繪圖卡(或稱工作站繪圖卡)產品-Radeon Pro VII,同樣採用7nm,但具備PCIe 4.0設計,並提供雙卡支援,同時具備6埠視訊輸出能力,再搭配AMD全新Radeon Pro Software for Enterprise驅動軟體,能發揮出超優異的雙精度浮點(FP64)效能,賦予CAE (電腦輔助工程)與HPC (高效能運算)行業絕佳的專業繪圖新體驗! 很多人會問說遊戲卡(例如GeForce或Radeon RX系列)就可以做到的事,為什麼要花n倍的錢去買專業卡(例如Quadro或Radeon Pro系列)呢?其實只要是在這個行業的人(動畫特效、工程繪圖、工程模擬、結構可視化應用、專業VR、專業美工、醫學影像、高效能運算…等等),都知道專業卡貴有貴的原因,主要可以從以下兩大特性來看。 第一:專業繪圖領域,不只看FP32 (單精度浮點)而已,更要看FP64 (雙精度浮點)效能。從下表可以看到,遊戲卡或入門專業繪圖卡,可能在FP32效能還不錯,動輒十幾 TFLOPS,但是你一看FP64效能的話,就掉到GFLOPS等級。這樣的顯示卡,真的就是「顯示卡」,在遊戲畫面中畫出一般場景的圖時,還OK,但要畫出工程繪圖等級、有許多複雜細部零件的設計圖,就有可能發生浮點計算出錯而讓Ren圖畫出瑕疵的畫面,或是根本畫不出來! ▼表 各專業繪圖卡或消費性顯示卡的規格比較 俗話說,時間就是金錢,一個客戶的案子若用遊戲卡來Ren圖,可能會花上一天的時間,且完成圖可能還有缺陷,準被客戶打槍。若改用專業繪圖卡,以其高速且大量記憶體,搭配更好的GPU核心來運算,就可能只要幾十分鐘就搞定。這就造就了不同級別的產品價位!(當然更高階的HPC與AI運算,則又是另一個級別就是了!) 第二:搭配的軟體相容性與優化程度!一些專業繪圖軟體、動畫特效軟體、工程繪圖軟體、內容創作軟體,為了要讓兼顧繪圖速度與品質,CPU通常要越快越好,若有GPU則能利用其硬體加速功能來加速繪圖。也就是說,這些生財工具軟體,除了要用高速CPU來執行之外,更要有GPU來搭配,才會畫得快、畫得精確。 因此,這些GPU大廠不是只有推專業顯示卡而已,更要推出其專屬的驅動軟體集、API、工具包,來建構軟體生態圈,以讓這些生財軟體大廠加入支援,例如CUDA平台、OpenGL平台、OpenCL平台、ROCm平台等等。因此這些GPU大廠在軟體相容性與優化上,也花了不少努力,為的就是獲得這些專業軟體的相容認證,以讓專業人士採用。當然,這部份也都要算在產品成本內,再加上必須滿足專業繪圖卡客戶的各式支援需求,也因此,專業繪圖卡的售價自然就水漲船高了! 正如上面所述,專業繪圖卡主要用途並不是拿來玩遊戲的,就算來玩遊戲也不一定快。這些卡擁有更高記憶體容量,並搭配Creator/Pro版本的驅動軟體,以及搭配專業繪圖工程軟體的軟體優化,才能發揮出高效能的專業繪圖水準。只是,真的售價不能再降低一點了嗎? 為此,AMD正式推出Radeon Pro VII專業繪圖卡,來打造出中階售價,高階效能的高C/P值專業繪圖卡。先看其規格吧!從上表可看到,該卡其實跟Radeon VII類似,但採用PCIe 4.0架構,兩者皆採用台積電7nm製程設計,搭載16GB HBM2 ECC記憶體,並具備CrossFire雙卡效能加乘功能,透過其Infinity Fabric Link橋接器,即可將兩GPU串起來。 在效能方面,配備60組CU (運算單元),擁有3840組Stream Processor (串流處理器),以及高達1TB/s的記憶體頻寬,在搭配Radeon Pro驅動軟體的發揮之下,可以達到13.1 TFLOPS的單精度浮點(FP32)效能,以及6.5 TFLOPS的雙精度浮點(FP64)效能。在視訊輸出效能方面,則配置6組miniDP埠,單埠可支援到8K 60Hz的輸出能力,若每埠都接顯示器的話,則具備4K 60Hz的輸出能力,因此對於需要大型視訊輸出應用來說,可以省下不少顯示卡的安裝! 在安全性方面,Radeon Pro VII在GPU也內建跟CPU一樣的AMD Secure Processor,可搭配微軟作業系統的安全機制,讓顯示卡也能支援安全信賴平台,預先為防駭做好準備! 至於在售價方面,Radeon Pro VII為1899美元,比其競爭對手(Quadro家族)便宜不少!且從其FP64的高效能表現,可說是一張具備超高C/P值的專業繪圖卡! 由於網友經常開玩笑說,NVIDIA常常「負優化」,而AMD則是「戰未來」!意思表示前者顯示卡在搭配初期驅動程式時,效能還不錯,但安裝新的版本之後,效能可能下降(例如《刺客教條:奧德賽》遊戲);而後者的顯示卡在搭配初期驅動程式時,經常好像無法讓一款遊戲發揮出更高的效能,不過透過其後續的驅動軟體優化,就能讓現有的顯示卡效能提升(例如。甚至前幾代的顯示卡,透過新版驅動程式還能玩最新3A遊戲,真可說是「戰未來」啊! 此外,AMD更透過韌體升級,讓先前顯示卡的,從這裡也可看出AMD一直很佛心地在為消費者追求的效能做打拼! 當然在專業繪圖卡領域,AMD也是一樣在戰未來,其專業版驅動程式也繼續為專業繪圖軟體做優化,目前平均每年將提升約14%的效能。 以下就透過AMD的簡報,來看看這次Radeon Pro VII的優勢。
-
世界最大顯示卡「出爐」! NVIDIA於GTC 2020前夕,「端出」DGX A100超級電腦系統
受疫情影響,NVIDIA預計於5月14日舉辦的GTC 2020 (GPU技術大會2020),將直接在線上演說,該大會將透漏下世代Ampere架構GPU,消費版本將採用10nm製程生產,而高階版本將可能採用7nm製程生產,讓其製程水準跟AMD一樣並駕齊驅。 NVIDIA目前主力的Turing架構GPU,分別導入其GeForce 16系列(包含GeForce GTX 1650 D5/D6版、1650 Super、1660、1660 Super與1660 Ti)、GeForce 20系列 (包含GeForce RTX 2060、2060 Super、2070、2070 Super、2080、2080 Super、2080 Ti),以及Quadro專業繪圖卡系列(包含Quadro RTX 3000 Mobile、4000、5000、6000、8000)。至於在其高階AI應用方面,也有Tesla T4等GPU產品,以其內建的Tensor核心和RT (光追) 核心,來帶動遊戲產業、專業繪圖應用領域,以及高效能運算、深度學習、數據中心等行業,進入新一代的光追與高效能AI繪圖應用。 然NVIDIA也在規劃其下世代的Ampere架構GPU,在消費性市場預計將命名為RTX 3000系列。在中,我們也透漏Ampere有可能採用三星10nm製程(8LPP),並透漏其最高階的GA102 (GeForce RTX 3080 Ti),效能將比現今TU102 (GeForce RTX 2080 Ti)的效能快高達40%。 ▼ NVIDIA Ampere GPU規格預測與效能對比 除了遊戲卡之外,NVIDIA還是非常注重高階應用市場。以HPC部份,Ampere架構GPU,其代號將是GA100 GPU,採用台積電7nm+製程,預計將具備8192組CUDA核心,時脈為2GHz (可加速至2.2GHz)、1024組Tensor核心、130組RT核心、同時將採用 HBM2e記憶體,容量高達48GB,時脈為1.2GHz,使其尖峰效能達到36 TFLOPs,而該GPU的TDP(功耗)也將高達300W。 #影片=https://www.youtube.com/watch?v=So7TNRhIYJ8 ▲ 採用Ampere架構的DGX A100超大GPU超級電腦系統「出爐」,老黃從其廚房的烤爐中「端出」 然在GTC 2020大會前夕,NVIDIA已先在其YouTube官方頻道釋出採用Ampere架構的DGX A100系統預告片,可看到NVIDIA執行長黃仁勳將該系統從廚房的烤箱「端出」,讓這款具備世界最大GPU的系統「出爐」! 由於DGX系統本來就是針對HPC與深度學習領域所打造的系統,需要有最快的運算效能,因此基本上「體.積.無.上.限」!從老黃將該系統端出來吃力的樣子,看起來非常的重啊!該影片的標題是「看老黃端出什麼菜?」而在敘述欄則標示「世界最大顯示卡,新鮮出爐!」看來,想要跟老黃比「大」,可能還得到後面站咧! NVIDIA在其DGX系統中,從最早的Volta系列,到Tesla系統,直到最近推出的,配置了16顆Tesla V100 GPU,成為HPC AI級應用的性能猛獸,當時NVIDIA就稱之為世界最大GPU系統。 至於這次老黃又端出來這款採用Ampere GPU所構成的DGX A100系統,看樣子將又要刷新上述DGX-2的世界最大GPU紀錄!其配置的GA100 GPU,將是Ampere系列中擁有最大顆GPU的產品(請Ponte Vecchio到旁邊站),而且將有可能看到旗艦級的128組ShaderModel配置設計。 從畫面可以看出,DGX A100的主機系統,上面配置了8顆Ampere GPU,並裝上超大散熱器,由於一般伺服器和HPC電腦系統的散熱設計大多是以被動式設計,因此可看到其與GPU相鄰的6個散熱器,可能主要是用於GPU之間,以及CPU至GPU之間的互連系統。搭配其CUDA軟體介面,將可能再次飆升其HPC領域的運算效能!無論如何,就等5/14的GTC 2020見真章了!
-
美國Aurora國家實驗室Exascale超級電腦配備揭曉,採用Intel Xe HPC ‘PVC’ GPU與Xeon Sapphire Rapids CPU,2021年開始部署 ft. 兩大CPU市場分析
這篇不是超級英雄之戰,而是超級電腦之戰!上週我們報導過Intel確認將推出,採用MCM封裝,該GPU核心就是Ponte Vecchio (義大利佛羅倫斯市內的一座老橋),採用7nm製程設計,裡面電容數超過數以十億計,大小為3696mm²,寬度比一顆AA電池還大!令人大開眼界! 由於先前,其合作內容是,Intel將與Cray一同建構起Exascale (百億億次級) 超級電腦,並於2021年部署!這次的超級電腦將採用兩組Sapphire Rapids Xeon處理器,以及高達6顆上述的Ponte Vecchio GPU,這些GPU將採用CXL (Compute Express Link)與OneAPI軟體堆疊來進行連接,以達到高效能運算目標。 由Intel主導的Aurora超級電腦建構計畫,已於日前公布其,該電腦將配備上述的2顆Sapphire Rapids Xeon CPU,以及6顆Ponte Vecchio (PVC)的Xe HPC等級GPU,預計將達到1 ExaFLOPs的巔峰效能,該系統將在2021年正式於Argonne國家實驗室部署,此將成為地表上首台Exascale級的超級電腦! 這款電腦由於配置了6顆PVC Xe HPC (7nm) GPU和2顆Sapphire Rapids Xeon CPU (10nm++) CPU,在各GPU之間將採用CXL (Compute Express Link)與OneAPI軟體堆疊來進行連接,系統採用統一記憶體架構(UMA)讓CPU和GPU的資料可以共用存取,以達到高效能運算目標。 這項計畫中,Intel主要負責做CPU與GPU,而Cray (克雷電腦)則負責設計載體,也就是他們Shasta系統,其包含機架與機櫃,該機架支持各種CPU,並能針對伺服器密度、散熱效率,以及高效能網路頻寬進行不同比例的優化 (Cray可說是這次計畫的SI廠商),讓Intel這個全新的處理器架構,能夠在高效能運算(HPC)應用中,穩定運作且發揮出全速效能。 而在記憶體、儲存裝置與頻寬部份,先說記憶體好了,他們表示正在尋找能配置超過10 PB (1 PB = 1024TB)的系統記憶體,搭配Cray的Slingshot Fabric互連機制。已知Aurora超級電腦的每個運算節點,總共有8個Slingshot Fabric進行互連,而該電腦系統也會採用兩種不同的檔案系統,其中一個是DAOS (分佈式異步對象儲存),另一個則是Lustre。兩者各有其優點,一個是高容量低頻寬,另一個則是相反,分述如下: (1) DAOS: 可支援大約 230 PB的儲存容量,頻寬超過25TB/s (2) Lustre: 可完整支援到150 PB 的儲存容量,頻寬大約1 TB/s 此外,在軟體方面,Cray也有自己的軟體堆疊層,可改善模組效率,同時提供統一的高效能互連機制。有鑑於其Slingshot是其第八代高速互連架構,具備許多HPC應用的必備特色,像是壅塞管理、僅3 hops的dragonfly系統,還有流量類別。同時還使用Rosetta高頻寬交換器,能提供高達25.6Tb/s的頻寬(單一方向為25GB/s),以符合Exascale等級的運算需求。 Intel Xe家族,依照等級高低可區分成最高階的HPC、中階的HP,以及消費性的LP。先說最高檔的HPC吧!這次的Ponte Vecchio (PVC) GPU,將採用7nm製程設計,搭配其Foveros 3D封裝技術,並以MCM的封裝設計,晶圓面積勢必不小。此外,每顆MCM GPU將通過EMIB (嵌入式多晶片互連橋接,Embedded Multi-die Interconnect Bridge)連接到高密度HBM(高頻寬記憶體)之DRAM封裝,並在旁邊放置一個更快速的Rambo Cache,該快取也是透過Foveros來進行連接。再搭配Cray的Slingshot提供節點之間的互連,便可透過Intel Xe Link將6顆Xe HPC GPU內部互連起來! 由於Intel的Xe HPC GPU,將具有幾千個EU (執行單元),目前已知Xe LP GPU有96組EU,每個EU共有8個核心,因此相乘起來共有768組GPU核心。目前Intel在Gen 9.5和Gen 11的GPU上,每個切片上面擁有8組EU,同時包含8組ALU (算術邏輯單元),而在Gen12 GPU的子切片中,其EU裡面有點像是NVIDIA在GPC裡面的Shader Model (SM)單元,或是AMD在Shader Engine裡面的CU (運算單元)的組成。因此這樣演化下去,將可以看到大量由許多子切片所組成的超級切片。 簡單來說,1顆具備1000個EU的GPU晶片,裡面就含有8000組GPU核心,不過有可能更多,因為先前有看到中階的Xe HP GPU以4顆堆起的大GPU,就內建了2048個EU (相當於16384組GPU核心)的設計,預期高階的Xe HPC GPU將可能更多,晶圓面積也將更巨大! 由於Xe HP GPU具備可變動向量寬度指令集,例如GPU專用的SIMT,以及CPU專用的SIMD格式,兩者搭配起來將有最大效能。而根據Xe HP GPU的單顆、雙顆、四顆搭起來之後,其效能大概可以預估如下: (1) Intel Xe HP (12.5) 1顆GPU: 512 EU (約4096核心,12.2 TFLOPs,150W) (2) Intel Xe HP (12.5) 2顆GPU: 1024 EU (約8192核心,20.48 TFLOPs,300W) (3) Intel Xe HP (12.5) 4顆GPU: 2048 EU (約16384 核心,36 TFLOPs,400~500W) 至於高階的Xe HPC GPU,Raja Koduri在Intel開發者大會提到,HPC將可達到1000個EU,相當於單顆就有8000個GPU核心,且提供40倍的雙精度浮點運算能力。其中,每個EU是透過新的可擴充式記憶體fabric架構來串連起來,這個新的互連架構就叫做XEMF (即Xe Memory Fabric),可提供數組高頻寬的記憶體通道。跟Xeon CPU一樣,Xe HPC GPU也需要配置具備ECC功能的記憶體來運作。 此外,Xe HPC還包含一個Rambo Cache,是一個超大型的快取架構,負責將多顆GPU串連在一起。此外透過該快取的巨大級記憶體頻寬,可以持續性的在雙精度運算中,提供尖峰的FP64運算效能。這樣在進行密集的AI運算時,能夠快速且有效的完成各式工作。 至於在製程方面,因為10nm升級到7nm,所以在GPU裡面也獲得一些關鍵性的提升,包含:7nm製程擁有10nm的兩倍密度、Die內部節點優化、設計準則減少4倍、採用EUV (極紫外)光刻機製程、採用下世代Foveros與EMIB封裝。 在伺服器處理器方面,Intel這次推出的Sapphire Raids Xeon伺服器處理器,將採用10nm++製程,將可能採用Willow Cove核心架構,以取代先前的Sunny Cove架構。此外,這次的Sapphire Raids Xeon處理器,搭配其最新的Eagle Stream晶片組平台,將首度支援到DDR5記憶體,以及PCIe 5.0架構 (對!直接跳到5.0了,不跟你AMD的4.0喇賽)。 說到這次新的Eagle Stream平台,將採用全新LGA 4677腳位,以取代先前Whitley的LGA 4189腳位(支援Cooper Lake-SP與Ice Lake-SP處理器)。(是的!腳位一直改!) 若跟AMD相比,AMD將於2021年推出EPYC “Milan”伺服器處理器,採用7nm Zen 3架構、支援PCIe 4.0與DDR4。而要是Intel不Delay的話,其2021年推出的Sapphire Rapids Xeon CPU雖說採用10nm++製程,且支援PCIe 5.0與DDR5,記憶體將支援到8通道,雖說製程落後(10nm++),但規格上卻領先,將可能又把AMD的Milan往下踩。也因此,AMD可能要加緊推出其EPYC “Genoa”,採用新的SP5腳位設計,將以5nm製程設計,支援DDR5與PCIe 5.0等新規格,來與Intel正面對戰! 上述只的是Intel於2021年必須交付的Aurora exascale系統。當然其實除了Intel之外,還有許多超級電腦標案,包括先前2018年IBM與NVIDIA合作的Summit與Sierra標案,分別擁有200與125 petaflops尖峰處理能力。而2020年AMD與NVIDIA即將交付的Perlmutter超級電腦,則採用上述Zen 3架構EPYC “Milan”處理器與NVIDIA的Tesla GPU,預期可以達到100 petaflops的處理能力,但這些案子都是屬於Pre-exascale等級的超級電腦標案。 至於比較具有可看性的Exascale超級電腦標案中,除了上述Intel標到的Aurora標案之外,AMD也有標到,由是AMD負責CPU與GPU的建構,Cray負責系統、機櫃與互連。在同樣建構Exascale超級電腦的計畫中,AMD表示將採用最新的EPYC 7000處理器,搭配自家Radeon Instinct GPU,來組成1.5百億億次級以上(1.5 exaFLOPs)尖峰處理能力的超級電腦,以用來處理天氣、亞原子結構、基因組學、物理學等科學進行模擬、建立模型等應用。這個案子的CPU和GPU都是AMD自己包辦! 除此之外,HPE (慧宇)也於今年3月標到,將與AMD合作(為什麼不選Intel? 耐人尋味!),共同打造2百億億次級以上(2 exaFLOPs)尖峰處理能力的超級電腦,並預定於2023年初部署,以提供美國國家核子安全總署(NNSA,National Nuclear Security Administration)使用,該超級電腦將主要用在核子武器建模 (疑? 不是拿來做COVID-19研究喔?!)。 從上述的Exascale超級電腦標案中,可看出AMD與HPE合作一起拿下的Frontier與El Capitan兩個標案,分別為1.5或2 exaFLOPS等級的超級電腦標案,相較於Intel拿到的Aurora標案僅 1 exaFLOPS,看來AMD陣營還是略勝一籌!只是2021年之後就都要交出成績單了,屆時就要看哪一家在Super Computing的效能競賽中獲得優勝了!誰能成為Super Computing業界中的SuperHero,目前還不曉得。只能說,2021年的伺服器市場戰役,將會非常精彩!
-
專訪夢想動畫公司!配置高效能GIGABYTE Server,以技嘉伺服器建構首屈一指的AI運算與遠端桌面動畫應用!
受益於電腦效能提升的一日千里,如今CG (電腦繪圖)的應用可說是越來越廣泛與精深,舉凡是電影、廣告、音樂電影、網路影片、遊戲等等,都可以看到電腦動畫的神乎其技,將栩栩如生與逼真的畫面呈現在世人面前,甚至可以與虛擬世界的人物進行互動,帶領人類進入如阿凡達電影般的奇幻境地。 為打造出專業級的CG殿堂,夢想動畫 (MoonShine Animation)於2012年成立,是一家以藝術家為中心的台灣本土動畫與視覺特效公司,目前有超過150位員工,擁有導演、專案經理、概念設計師、動畫師、合成師、特效師、研發工程師、互動設計師…等職位,設計出多元的作品,涵蓋視覺特效、動畫、技術研發、遊戲、VR與互動…等領域,並從事文化內容再造等業務。該團隊承接過國內各大公司的動畫製作案,並參與過電影之視覺特效,為國內首屈一指的動畫製作公司。 為進一步了解動畫公司的辦公室是長什麼樣子,以及動畫公司如何配置其電腦裝備,並利用其新購入的技嘉伺服器來擔任什麼樣的角色,以下PCDIY!將帶您進入位於南港的夢想動畫公司總部,專訪創辦人林家齊先生,來深入了解動畫與視覺特效領域,以及他們電腦的應用配置。 大家對於動畫公司所經營的業務範圍可能比較陌生,有鑑於此,林家齊介紹了夢想動畫的主要業務,涵蓋了:概念圖、海報、3D廣告、動畫、互動,以及文化內容再造,這些都屬於動畫公司會製作到的內容,隨著近年來不少學生與社會人士對於動畫製作上也有興趣,該公司更舉辦線上課程,讓學員們可以透過該公司的教學課程,來吸收到動畫相關的知識! 由於夢想動畫承接過不少大廠委託設計的各式知名動畫作品,這些成品讓人看了之後覺得非常令人激賞,也深深感受到夢想動畫高深的製作功力。相信有不少玩家想知道,以這些作品來看看,需要花到多少人力與時間來開發! 林家齊表示,由於動畫公司除了與客戶直接聯繫之外,還會與其他廠商如製作公司、代理商互相往來,因此一般大多會看專案的大小與金額來設定。以粗略來計算,一般動畫案子大約需要20~30人,為期半年的執行時間,前期的討論與定稿花比較久,真正製作期大約3個月。 至於比較知名大大型案子,他以先前幫國內某知名航空的動畫製作案子為例,該案子整體需要動員到150人月的人力配置,因為執行期間非常長,從概念發想到實際完成,大約一年左右。由於前期設定、溝通、討論到視覺定案,可說是非常繁瑣的過程,因此會花比較久的時間來執行,真正擬定好角色、材質設計、視覺定稿完成之後,後續的動畫製作期間就可以非常快了。 而在製作的過程中,許多都是要透過想像與實際的結合,來做出生動的畫面。以飛機機艙內的廁所或安全門為例,由於實體並不存在,製作小組必須依照真實物體的配色來刻劃,且必要的細節都要非常接近真實比例,以及結構上合理性,才會讓客戶與觀眾感覺到有真實感。 林家齊也簡介其公司的內容簡報,以介紹夢想動畫的辦公室配置、歷年作品、拍攝展示、以及近年正研究中的AI輔助動畫設計。 由於當今動畫特效越來越進步,不少產業紛紛導入AI (人工智慧)來幫助動畫製作,這部份,夢想動畫也有導入。林家齊簡單說明其作品製作時的大致流程。 首先,夢想動畫在內湖有個虛擬攝影棚,可進行3D動作捕捉(MoCap),以與遊戲 進行串接。在動畫的製作過程中,人物必須以真性情的面貌呈現,但電腦並不曉得怎麼揣摩人類的表情,因此這部份可以透過深度學習的方式,訓練AI幫結果繪製出來。如上述的幾張圖中,有郭雪湖畫風的膠彩畫,透過AI的訓練之下,便可繪製出擬真的畫面。這些效果看起來並不是濾鏡,包含筆觸等都會學習。而夢想動畫也期望在未來,透過新科技的幫助,來改變一些做法。 再來是預視模擬畫面,以Styleframe單張畫格的風格設定,再搭配我們所要呈現出來的畫面,透過電腦AI的拼湊之下,即可呈現出初期的動畫,就連光線與陰影細節都能清楚描繪出來!此外,2D動畫也能透過Toon Shader的方式,搭配真人動態捕捉,來成就出類似日式動漫的風格。當然像是人臉模仿、深偽(Deep Fake)表情技術,透過AI也是可以做到的。 簡單來說,AI可讓作品還沒上色前,就能模擬出成品的樣子,減少先前必須一張一張去細修的工作,讓品質更加分。以AI為主的動畫製作,雖然不能完全取代人工製作,但可以輔助許多以往必須花費大量人力去製作的畫面(像是先前沒看過的畫面,或是世界上沒有的場景等),只要賦予一些想像空間,餵入作家的筆觸資料與畫風,AI就能透過這些學習資料,繪製出想要繪出的畫面。 當然,AI也可以用來將畫面從2K轉成4K解析度,由黑白轉彩色!可說是以破壞式創新勾勒未來動畫的製作方向,不但能解決以往不能解決的問題,並且加速成品完成,可說是未來動畫製作的一項重大利器! 不少動畫都非常仰賴「高效能運算」(HPC)伺服器,來加速圖像的計算與處裡,包含視覺特效、光線追蹤、影像後製…等等。那麼夢想動畫在HPC伺服器上面,是如何配置的,以及其規格如何?林家齊表示,以往採購的主要考量,大多是以CPU的核心數量為基準,也就是「時脈*核心數/價格」的公式,來評量機器的採購準則。不過隨著近年來,考量到CG製作為主,也會參考CineBench的跑分,來計算出效能比。這些都算是典型的評量方法。 近幾年AI動畫的運用需求越來越高。在機器配置上,除了CPU效能比之外,GPU效能比也被列入評量範圍。GPU效能比稍微複雜一點,像是以AI運算為主的電腦,就需要搭配超高視訊記憶體的GPU才行。例如人臉模擬的話,就非常吃記憶體,若在記憶體太小的GPU (如8GB以下)做訓練,可能要30天才能跑完。而改用48GB等級的專業GPU,大概只要1天就可以搞定!從這裡就可以看出效能差距的級別! 林家齊表示這次購入技嘉G191伺服器,主要有兩個用途,原本的用途主要是用來做AI運算的,由於一般市售1U的伺服器,最多只能塞2張繪圖卡。而技嘉這款伺服器能在1U的高度塞入4張專業級的繪圖卡,是以往沒看過的設計,不僅大幅省去伺服機櫃的空間,也讓效能提升。此外,配置雙路處理器,能發揮更多執行緒(共36核心72執行緒),搭配風流設計採前導後出,將散熱效率最大化,在做HPC運算時不僅可以能發揮最高效能,並可達到最佳能效。因此夢想動畫購入技嘉G191伺服器,主要目的就是用來當做AI運算的伺服主機。 在規格方面,夢想動畫新購入的技嘉G191-H44伺服器,安裝了Intel第二代Xeon Gold 6240可擴充處理器兩顆,提供36個核心72條執行緒;在GPU方面,則是安裝了NVIDIA Quadro RTX 8000繪圖卡(48GB GDDR6) 4張;系統記憶體則是在24組DIMM上安裝32GB的DDR4記憶體,總數達到768GB;至於儲存裝置則安裝4顆2TB的SSD為主(另有其他儲存伺服器做儲存,此伺服器主要用來做高效能運算),成為公司最強的AI運算專用伺服器。 那麼為何沒有安裝到Tesla等級的繪圖加速卡?林家齊表示那屬於不同的應用級別,Tesla屬於大量AI運算的領域,而選用Quadro,一方面除了前述人臉模擬需要用到高記憶體繪圖卡才行,且Quadro RTX具備光線追蹤特效,可加速動畫繪製,因此公司裝到這個級別,已可符合自家Render Farm (算圖農場)的需求。至於辦公室的員工電腦,則配置到一般GeForce的遊戲顯示卡就可以了!主要是GeForce在本地端執行動畫軟體工具時,就有足夠的繪圖效能提升效果,符合絕大多數應用需求。 購入技嘉超強伺服器,原先規劃用來做AI運算應用,但由於今年的疫情爆發,使得大型動畫專案紛紛延後,必要的話就連員工也得居家工作,屆時不可能每個人的家裡都有很強悍的電腦能拿來製作動畫,準備高效能電腦給員工的話又不好管理。因此,林家齊與其IT部門一起挖掘出這款技嘉伺服器的第二用途,也就是雲端桌面應用! 林家齊透漏,之所以會選擇Quadro繪圖卡做為雲端桌面/虛擬桌面架構(VDI)應用,讓一般入門級Mini PC (迷你電腦)或Thin Client (精簡型電腦)也能透過網路,連接到技嘉伺服器執行遠端桌面進行動畫製作,主要是考量,目前的遠端桌面解決方案(如AnyDesk、TeamViewer)都沒有經過最佳壓縮處理,或運用到硬體的加速優勢,使得操作上會有點卡卡的!而Quadro繪圖卡搭配其驅動程式,不僅可以做到即時的視訊輸出,再加上Quadro RTX 6000以上等級專業繪圖卡具備GRID (虛擬化GPU運用)功能,搭配Intel多核心處理器有針對Adobe相關創作者軟體優化,以及許多專業繪圖都有提供NVIDIA的CUDA硬體加速功能,就連vGPU也能加速,這樣一來,就能發揮出相輔相成的效能加乘效果!這樣一來,就能建構GPU加速的遠端桌面環境,成為最佳遠端桌面繪圖伺服器。 林家齊表示,目前技嘉伺服器,變成以運用於虛擬桌面架構(VDI)為主,讓在遠端工作的員工,只要在家裡用微軟RDP (遠端桌面)工具,就能連回公司的雲端桌面,並執行那些會吃GPU資源的生財軟體,即使在家也能進行動畫製作,至於一般沒有要製作動畫時,也是可以透過RDP連回公司電腦,來進行安全上網與文書工作。 以目前的規畫,技嘉伺服器在VDI資源上共有72個vCPU (虛擬機CPU核心),近768GB的vMEM (虛擬機記憶體),以及4顆vGPU (虛擬機GPU數)相當於共有18432個CUDA核心,與384GB的vGPUmem (虛擬機視訊記憶體),因此林家齊將其分割成24組動畫製作級別虛擬機帳號或是192組一般文書工作帳號,並透過動態調配的方式來分配資源給需要的員工使用,讓伺服器應用效益最大化!以下是我們PCDIY!估算的虛擬機資源分配結果。 (1) 24組動畫製作級別虛擬機帳號:每個帳號平均可享用約3 vCPU、32GB vMEM、768個CUDA核心,以及16GB vGPUmem,主要給動畫製作使用 (2) 192組一般文書工作帳號:就是將動畫製作等級的VDI切成8個資源,變成每個帳號享有約1GHz的vCPU資源、4GB的vMEM資源、96個CUDA核心,以及2GB的vGPUmem,主要給一般上網與文書工作使用,可以播放影片 透過上述的資源切割,技嘉伺服器就相當於是24台繪圖工作站的效益,讓員工可以遠端工作。至於上述提到的也可以等同於192部文書工作機的資源,其考量是為避免受到駭客或有害軟體(例如勒索病毒)的攻擊,公司端的本地端電腦只提供Intranet (內網)連線功能,必須用RDP連接到技嘉伺服器的帳號,才能連到Internet (外網)進行上網或其他對外溝通。這樣分層管理不僅可以抵禦病毒入侵,IT部門也容易管控以打造安全的工作環境,提升公司資安等級! 接下來看看夢想動畫的電腦教室,這裡就是VDI應用的最佳實作場域了。這裡的每台電腦都只有配備簡單的螢幕、鍵盤與滑鼠,並連到一台早期的智慧電腦棒(Compute Stick),這款電腦棒算是2016年的老機種了,內建Atom Z8300處理器,搭載DDR3 2GB與32GB eMMC記憶體,並配備Win10 Home 32bit版本,算是最基本入門電腦。 林家齊透過這樣的超精簡型電腦,來展示連接到技嘉伺服器,並執行3D特效製作軟體Houdini FX進行多組3D模型的即時繪製。結果畫面呈現非常即時!場景變換流暢不卡頓,學生們可透過這樣的方式來學習與創作,就算在家也能享有一樣的體驗。 #影片=https://www.youtube.com/watch?v=X0B_Mqi4xVI ▲林家齊現場展示以該精簡電腦,連接到其技嘉伺服器,執行3D特效製作軟體Houdini FX,以進行多3D模型的即時繪製 至於導入這台技嘉伺服器的效益,對於生產力的提升有什麼幫助?林家齊表示,透過將伺服器切分成24台動畫製作級別虛擬機後,平均每部VDI成本大約2.5萬元,這樣的配置,是繪圖工作站的等級,員工不僅可以在自己的電腦上進行動畫製作,回到家也能延伸其使用體驗,且必要時,公司亦可根據執行的案量來動態調配虛擬機資源,算是大大提升員工的工作效率。 一般台灣動畫公司多以動畫代工(OEM)為主要業務,承接客戶的多種動畫案,這些案子可能會拆分到多家動畫公司,且有NDA約束,執行的內容都不可對外公開,甚至無法列出動畫師的名字,如同資訊工人一般的被忽略掉,長期下來對員工的身心發展也會有影響。 因此林家齊在一開始成立夢想動畫時,其案子類型就定位在不以OEM為主,而是以偏向以主創性製作(ODM)為主,包含自己擔任導演或是創意發想,甚至可以參與設計與故事腳本,產品共同掛名,以展示出自己的品牌,夢想動畫期望在客戶的幕後團隊列表中,將自己站在產業鏈的前端。 從上述的訪談當中,可以發現夢想動畫不只在實現夢想,更以務實之態度,來打造專業級的動畫殿堂,同時也立志成為動畫產業的翹楚,在科技與電腦的搭配上更是令同業刮目相看。以這次導入技嘉G191-H44的1U高效能伺服器為例,其搭配雙Xeon處理器與NVIDIA Quadro繪圖卡,從原先打造AI運算為主,到後來轉換成以VDI應用為主,實現讓員工遠端動畫製作以及安全上網的絕佳工作環境,同時也為同業先鋒,開創遠端工作的無限可能。 當然不僅僅是為了防疫需求,夢想動畫更計畫在未來高雄分公司的電腦配置上,也採用這種遠端VDI方式,透過從高雄連回台北的方式,打造出任何裝置、任何地點與任何時間都能進行動畫製作的環境。 廠商名稱:GIGABYTE Server 技嘉伺服器 - GIGA COMPUTING 技鋼科技股份有限公司 廠商電話:0800-079-800 廠商網址: →更多的【PCDIY! Server Workstation 伺服器 工作站 / HEDT 高階桌機 主機板 / WS 工作站 主機板】: →更多的【PCDIY! CPU / 中央處理器】: →更多的【PCDIY! MainBoard 主機板 / Gaming M/B 電競主機板 / Creator M/B 創作者主機板 / HEDT 高階桌機 主機板】: →更多的【PCDIY! DRAM / 記憶體 / 超頻記憶體模組】: →更多的【PCDIY! SSD / 固態硬碟】: →更多的【PCDIY! NAS / 網路儲存裝置】: →更多的【PCDIY! Enterprise 企業級 商用 - 路由器 / 無線路由器 / AP / 交換器 / IIoT / 防火牆】:
-
Infortrend 橫向擴展 NAS 機種支援 SMB Multichannel
普安科技® (股票代碼:2495) 為業界領先的企業級資料儲存專家,旗下的橫向擴展 (scale-out) NAS EonStor CS 機種最新採用 SMB Multichannel 功能。透過 SMB Multichannel,EonStor CS 叢集可與用戶端裝置藉由聚合網路介面卡 (NIC) 建立多個同時網路連線。對於效能需求極高的應用而言,如多媒體影音產業常見的 4K 影像剪輯、廣播或即時影音串流以及高效能運算 (HPC),則可大幅增加可用頻寬、資料儲存效能及容錯能力。 EonStor CS 為橫向擴展 (scale-out) NAS,可在單一叢集中擴充至 144 個節點,總體資料傳輸量超過每秒 100 GB 且儲存容量可達 100 PB。啟動 SMB Multichannel 後,SMB 3.0 用戶端能夠透過多個路徑存取 CS 儲存空間內的資料;與透過單一路徑存取資料時相比,此功能不僅可聚合網路頻寬,更可增強網路容錯能力。 SMB Multichannel 帶來更高的可用頻寬及系統效能,有助於處理效能需求極高的工作負載。此功能可聚合多個網路介面,透過多個網路通道同時讀取及寫入資料,顯著提升整體效能。此外,更能夠自動偵測故障發生,並將資料傳輸程序移轉至其他正常運作的網路通道處理,確保連線不中斷、強化系統可用性。 普安科技產品企劃部資深經理李金溪表示:「加入 SMB Multichannel 功能後,不僅可以提高 EonStor CS 橫向擴展 NAS 效能,更能確保網路服務不中斷,相當適合進行各種時間敏感 (time-sensitive) 及高可用性 (high availability) 應用。 例如,在多媒體影音產業中,剪輯4K 以上高畫質影片時需要極高的網路頻寬。透過 SMB Multichannel 連接多個網路介面後,便可以順利進行多人協作,無需擔憂頻寬不足或系統停機的問題。」
-
AMD第二代新款EPYC 7Fx2家族伺服器追加上市,主攻8、16、24核市場,提供C/P更高的HPC運算效能
AMD自2019年8月8日正式發表,採用Zen 2架構、7nm製程,並支援PCIe 4.0規範,最高達64核心、128執行緒,提供HPC (高效能運算)環境絕佳的運算效能,讓業界刮目相看! 隨著AMD第二代EPYC處理器的上市,,以更優勢的價格來供應企業用戶使用。如今,AMD可說是逐漸在伺服器市場嶄露頭角,隨著伺服器的主流市場逐漸往8核至20核心來發展,AMD也乘勝追擊,於2020年4月14日再推出新的EPYC 7Fx2家族伺服器處理器共三款,包括EPYC 7F72 (24核心)、EPYC 7F52 (16核)與EPYC 7F32 (8核心)等三顆全新CPU,以提供比自家7002同級產品更高的運作,以更具C/P值的設計,讓企業可以加速導入。 先前AMD推出的EPYC 7002系列伺服器處理器(代號‘Rome’,羅馬),採用Zen 2架構,並以全新7nm製程生產,能支援PCIe 4.0規格,以及DDR4-3200記憶體,賦予優勢的I/O與記憶體頻寬,且在L3快取提升了4倍,使效能比上一代EPYC快高達23%的IPC (每時脈執行指令數)。 EPYC不僅從架構上提升,更提供先進的安全功能,能幫助客戶保護最重要的數位資產。最高版本的EPYC 7002系列(7742/7702/7702P)擁有高達64核心、128執行緒為例,導入AMD EPYC平台,相較於競爭對手平台,能有效降低TCO (總擁有成本)達50%。 後來EPYC 64核心家族新增一個7H12的型號,為旗艦款,擁有更高時脈效能,但TDP也增加到280W,此外在今年2月還新增了入門款64核心的EPYC 7662,時脈較低,且TDP也比較低。至於32核心也有新的7532,時脈降低一些,但L3快取容量倍增。 為加速伺服器市場生態系的動能,AMD EPYC已陸續與亞馬遜、Google Cloud、微軟Azure、IBM Cloud、Oracle Cloud、騰訊雲等雲端業者合作,且先前更標下了美國能源局在Oak Ridge國家實驗室的Exascale超級電腦標案,將於2021年打造出1.5 ExaFlops等級的超級電腦-Frontier,此外,更獲得Lawrence Livermore國家實驗室的導入,以及美國各公家單位的採用。由此可見AMD可說是在伺服器市場初露曙光! 由於EPYC 7002家族,最高檔的7742雖說有64核心,但價位其實滿高的,也許效能很強,但耗電量也高,因此不一定符合TCO成本。以一般數據中心、密集運算來說,目前大多的密集性運算工作,其實很多時間是不太需要用到那麼多核心數的,此外像是虛擬機應用方面,像VMware這類的軟體是以單顆處理器的核心數來計價,越多核心的費用也越高()。因此對於整體部署成本來說,其實從記憶體要裝多一點之外,CPU內部的L3快取容量增大,對於伺服器在處理大量運算時,效能提升也比較明顯。 正因此,為達到最佳部署甜蜜點,AMD再次推出三款EPYC 7Fx2家族伺服器處理器,比自家同核心數級的7002系列的時脈和快取容量還要高,因此7Fx2家族將擁有更好的效能表現。以下是7002與7Fx2家族的產品規格列表。 ▼AMD第二代EPYC伺服器處理器 (代號Rome)規格列表 (橘色字為這次發表之新品) 從上表可以看到,這次7Fx2家族,最高等級的EPYC 7F72,擁有24核48緒,時脈為3.2~3.7GHz,L3快取增加到192MB,隨之而來的TDP比較高,達到240W,相較於7402來說,各方面的規格都更好,值得密集運算應用伺服器使用,當然價錢也比較貴一點點就是了! 至於主流的EPYC 7F52,擁有16核32緒,時脈比7302還高,達到3.5~ 3.9GHz,L3快取更是倍增到256GB,比7F72還高,再加上16核32緒裝2顆之後總共為實體32核心,算是一套VMware的授權費,因此AMD認為這顆伺服器處理器不僅時脈更高,將能成為虛擬機器的最佳選擇,因此在售價上將7F52訂得還比7F72高,不過整體來說還是比競爭對手的低就是了! 至於入門的EPYC 7F32則擁有8核16緒,時脈比7262高一些,達到3.7~3.9GHz,但L3則維持不變,售價卻比7262多近4倍!主打高效能入門伺服器市場! 上述的EPYC家族都可以搭配既有的EPYC 7002專用伺服器主機板使用,只要更新BIOS即可支援新的7Fx2處理器,至於TDP方面由於伺服器主機板皆能支援到280W的功耗,因此要應付TDP最高到240W的7Fx2家族,絕對是綽綽有餘! 因為這次EPYC 7Fx2家族,擁有更高效能、更多的L3快取,更可以雙路配置,讓伺服器效能再往上飆升,因此有越來越多一線伺服器大廠,紛紛導入7Fx2家族處理器,來建構各式伺服器產品。以下就透過簡報來看看AMD這次的出牌吧!
-
AMD第2代EPYC處理器為IBM Cloud全新裸機伺服器提供強大效能,全新方案為每台伺服器提供超過2倍的可用裸機核心數量,進一步擴大IBM裸機伺服器的效能輸出
AMD(NASDAQ: AMD)宣布IBM Cloud最新裸機伺服器(Bare Metal Servers)將採用AMD第2代EPYC處理器,以強化其全球基礎架構。隨著AMD EPYC 7642處理器加入其雲端陣營,IBM的裸機方案能夠擁有更高的運算效能。這些新款裸機伺服器目前已上市,為IBM Cloud首款搭載AMD第2代EPYC的產品,專注於各種現代工作負載所需的運算能力與效能,其中包括資料分析、電子設計自動化、人工智慧,以及虛擬化與容器化(containerized)工作負載。 AMD全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理Forrest Norrod表示,AMD第2代EPYC處理器提供至關重要的效能,滿足雲端服務供應商對關鍵工作負載的需求,其中包括核心數量、擴充性以及吞吐量。我們很高興將AMD第2代EPYC處理器的優勢延伸到IBM Cloud的全新裸機方案,協助客戶解決現今各種涉及密集運算的工作負載。 IBM雲端基礎架構服務部門總經理Satinder Sethi表示,我們非常高興推出採用AMD第2代EPYC處理器的全新IBM Cloud方案。藉由這些全新處理器,我們可以提供IBM Cloud客戶更多元的選擇與靈活性,挑選最適合的平台,以滿足當前要求最嚴苛的工作負載需求。我們期盼未來能持續為我們的客戶提供創新成果與價值。 • 每伺服器平台擁有96個CPU核心 • 基礎時脈頻率為2.3GHz,最大頻率可提升至3.3GHz註1 • 每插槽配置8條記憶體通道,提供卓越的記憶體頻寬 • 可支援高達4TB的記憶體組態 • 提供多達24個本地儲存硬碟 • 作業系統可選用RHEL、CentOS、Ubuntu以及MS Server • 每月按使用量計費 • 可透過全球IBM Cloud Catalogue、API或CLI等通路訂購 新款裸機伺服器已配置於北美、歐洲和亞太地區的各大IBM資料中心。採用AMD EPYC 7642的伺服器可以透過IBM Cloud全球型錄平台、API或CLI訂購,並以按使用量的月費模式使用。請參閱IBM Cloud來開始構建採用AMD第2代EPYC處理器的裸機伺服器。
-
刷新紀錄!華碩1P/2P伺服器奪578項SPEC標準評測佳績
華碩今日宣布旗下伺服器本月初於國際性標準性能評試機構—SPEC(Standard Performance Evaluation Corporation)的標準測試最新結果中勇奪578項世界紀錄,不僅創下歷來之最,獲第一名佳績的項目數更以30%差距領先競爭對手,持續穩居伺服器系統、伺服器主機板、工作站與工作站主機板的領導品牌寶座。華碩伺服器搭載Intel®/AMD®處理器,並採用獨家效能調校技術,能提供風馳電擎的強大運算效能,不論是AI人工智慧、高效能計算(HPC)、資料分析與基礎架構管理等應用,一切皆能游刃有餘,為企業用戶打造極臻完美的運算解決方案。 專為千億級高速浮點運算而生的「ESC8000 G4」機架型伺服器搭載第1代與第2代Intel® Xeon® Scalable處理器,於「SPEC CPU® 2017」標準評測項目中一舉囊括192項世界紀錄;其中,採用Intel® Xeon® Scalable Platinum 8280L處理器的ESC8000 G4伺服器,亦於標準評測項目榮獲最高分數。ESC8000 G4不僅具備高密度運算能力與靈活擴充設計,也支援Intel® Optane™持續性記憶體,能讓密集運算應用效能巨幅躍進,加上內建的ASMB9-iKVM伺服器管理方案,自由切換單開或雙開複合模式,大幅提升控管效率,滿足用戶對於AI訓練、高效能計算(HPC)、資料分析、資料中心運算等應用,將強大運算效能推升至嶄新境界。 兼具靈活擴充與出色效能的「RS300 E10」機架式伺服器於「SPEC CPU® 2017」標準評測項目中,一舉寫下含括「SPECint 2017」與「SPECfp 2017」在內的96項世界紀錄,其配備Intel® Xeon™ E2200處理器、四個Intel® 乙太網路連接埠與高度擴充性等優異特色,能提供強大的運算能力、減少延遲,進而推升整體效能表現,適合入門級伺服器、伺服器訊息區塊系統、邊緣運算與其他應用,為中小企業用戶的伺服器首選。 搭載AMD® EPYC™ 7002處理器的1P與2P伺服器於「SPEC CPU® 2017」標準評測項目中,一舉拿下102項世界紀錄,而1P伺服器「RS500A E10」與2P伺服器「RS700A E9 V2」於標準測試分別獲得64項與38項的世界第一;其中,2P伺服器「RS700A E9 V2」最高支援64核心、128執行緒、8通道DDR4、128個PCIe® 4.0通道,能加速資訊傳輸與減少運算時間,輕而易舉完成AI訓練、架構虛擬化、虛擬桌面 (VDI)、軟體定義等應用,滿足企業用戶的多功負載、頂尖效能等運算需求。 為提供企業用戶卓越出眾的伺服器效能表現,華碩研發獨家效能調校技術,含括核心最佳化、引擎增壓、工作負載預設集三大特色。「核心最佳化」技術能大幅提升多核心運算效能、減少頻率切換造成的延遲,並搭配「引擎增壓」的創新電壓設計,能自動為運算效能加速、強化效能表現,最後加上關鍵的「工作負載預設集」,能於BIOS中預先設定最佳化的伺服器設定檔,讓整體的效能與效率巨幅躍進,自此將效能表現推升至全新境界,為企業用戶提供最高品質的運算解決方案。
-
華碩伺服器搭載全新Power Balancer技術與第二代Intel® Xeon® Scalable處理器,省電、效能雙管齊下 為伺服器開創嶄新標準
華碩伺服器去年於國際性標準性能評試機構—SPEC(Standard Performance Evaluation Corporation)的標準測試中勇奪246項世界紀錄,深耕伺服器產業並累積長達23年以上的豐碩經驗,為伺服器系統、伺服器主機板、工作站與工作站主機板的領導品牌。為提供用戶愈臻卓越的運算方案,華碩今日發表獨家Power Balancer技術,將應用於「RS720/720Q/700 E9」、「RS520/500 E9」與「ESC8000/4000 G4」系列伺服器,其具備即時監控與自動調節處理器負載技術,搭配第二代Intel® Xeon® Scalable處理器,能提供風馳電擎的運算效能,且最高可為每個節點節省約31瓦特電力,進而為企業用戶大幅降低用電成本與維持最佳效能,打造極臻完美的運算解決方案。 在高效能運算、AI人工智慧 或邊緣運算等複雜的應用中,如何在效能與耗電量之間取得平衡,已成為伺服器產業的重要課題。隨著第二代Intel® Xeon® Scalable處理器問世,華碩亦推出全新研發的Power Balancer技術,能即時監控且自動調整處理器負載,大幅降低整體耗電與提升效能表現,充分發揮第二代Intel® Xeon® Scalable處理器的威力。經測試,在維持相同效能時,搭載華碩獨家Power Balancer技術的伺服器最高可節省約14%用電,藉由自動調整處理器頻率,在多執行緒的運作方式中有效降低耗電量,為企業省下可觀的用電成本。此外,根據「SPEC CPU® 2017」標準評測顯示,搭載第二代Intel® Xeon® Scalable處理器與Power Balancer技術的伺服器,最高可提升36%的運算效能,同時支援Intel® Optane™持續性記憶體,讓記憶體與儲存能力巨幅躍進,提供用戶前所未見的運算效能表現。 華碩伺服器搭載獨家Power Balancer技術、第二代Intel® Xeon® Scalable處理器,以及支援Intel® Optane™持續性記憶體,不僅能大幅降低整體耗電量,更以卓越出眾的極致效能,為企業用戶提供極臻完美的IT解決方案。其中,專為高密度運算而生的「ESC8000/4000 G4」機架型伺服器,能提供極致強大的運算能力,滿足用戶對於AI訓練、虛擬桌面 (VDI)、渲染與科學研究等應用,一切皆能游刃有餘;專為高效能工作負載量身訂製的「RS720/720Q/700 E9」機架型伺服器,具2U/1U設計,能滿足企業用戶的多功負載、頂尖效能等運算需求;具備靈活擴充特色的「RS520/500 E9」機架型伺服器,共有4U/2U/1U設計,不論是效能、資料儲存與管理表現,皆能為企業提供全方位的基礎架構管理解決方案。
最多人點閱
- SUPERMICRO SUPERO C7Z170-OCE開箱實測,伺服器級電競主機板全面來襲!
- 《Bloomberg BusinessWeek》彭博商業周刊爆料 美超微伺服器主機板 黑客門 被偷裝間諜晶片,《Apple、Amazon、SuperMicro》發表聲明駁斥 報導不屬實 精心編造
- OssLab磐石至尊洋垃圾二手主機殺很大,「Xeon E5-2650八核處理器+X79主機板+64GB記憶體+顯卡+機殼電源」大全配10600元!
- AMD Ryzen Threadripper 2代全系列正式上市,2920X、2950X、2970WX與2990WX開箱與效能實測!
- 配備72核心的「武士降臨」,Intel Xeon Phi超級電腦晶片即將上市!
- 專訪夢想動畫公司!配置高效能GIGABYTE Server,以技嘉伺服器建構首屈一指的AI運算與遠端桌面動畫應用!
- SUPERMICRO SUPERO C7Z270-CG實測開箱,伺服器級電競主機板重裝上陣!
- GPU不只能玩遊戲,NVIDIA推出Hyperscale級加速器:Tesla M40、Tesla M4 GPU
- 自組超級NAS不是夢》微型伺服器新板王,永擎電子ASRock Rack C2750D4I主機板新登場!
- 邁向家用10GbE網路,洋垃圾Intel 10GbE網路卡X540T1玩家實戰!
- 伺服器1萬元起,比你手機還便宜!OSSLab多款伺服器主機 + 組件強檔上市,IT採購、組裝與升級的第一選擇
- SUPERMICRO SUPERO C7H170-M主機板開啟「非K可超」新紀元,超頻的崛起!